建立强大的确定性神经网络仍然是一个挑战。一方面,某些方法以降低某些情况下的分类准确性为代价改善了分布检测。另一方面,某些方法同时提高了分类准确性,不确定性估计和分布外检测,但以降低推理效率为代价。在本文中,我们提出了使用Dismax损失的培训确定性神经网络,这是对通常的软马克斯损失的倒入替换(即,线性输出层的组合,软磁性激活和交叉透射率损失) 。从Isomax+损失开始,我们根据所有原型的距离创建每个logit,而不仅仅是与正确类关联的logit。我们还引入了一种结合图像的机制,以构建所谓的分数概率正则化。此外,我们提出了一种快速训练后校准网络的方法。最后,我们提出一个复合分数以执行分布外检测。我们的实验表明,Dismax通常在分类准确性,不确定性估计和分布外检测方面同时优于当前方法,同时保持确定性的神经网络推断效率。重现结果的代码可在https://github.com/dlmacedo/distinction-maximization-loss上获得。
translated by 谷歌翻译
手语是一种基本资源,可以访问遭受遭受禁用听力损失的个人的通信和适当的社会间谍开发。由于该人群预计到2050年的人口达到7亿,因此该语言的重要性变得更加重要,因为它发挥着重要作用,以确保在社会中纳入这些人。标志语言识别领域的目标是弥合用户和非用户的符号语言之间的差距。然而,数据集的数量和质量的稀缺是限制新型方法探索的主要挑战之一,这可能导致该研究区域的显着进步。因此,本文通过引入美国标志语言的两个新数据集:第一个由签名者的三维表示组成,而第二个是由签名的前所未有的语言学的表示组成,其中包含一组标志的语音属性。
translated by 谷歌翻译
通过面部和物理表达表达和识别情绪是社会互动的重要组成部分。情绪识别是计算机愿景的基本任务,由于其各种应用,主要用于允许人类和机器之间更加自然的相互作用。情感识别侧重于分析面部表情的常见方法,需要图像中面部的自动定位。虽然这些方法可以在受控场景中正确地分类情绪,但是在处理无约束的日常交互时,这种技术有限。我们提出了一种基于自适应多线索的情感认可的新深度学习方法,从而提取来自上下文和身体姿势的信息,人类通常用于社会互动和沟通。我们将所提出的方法与CAER-S数据集中的最先进方法进行比较,评估达到89.30%的管道中的不同组件
translated by 谷歌翻译
本文提出了一种从示威(LFD)中进行深度机器人学习的新型概率方法。深度运动原语(DMP)是确定性的LFD模型,可直接将视觉信息映射到机器人轨迹中。本文扩展了DMP,并提出了一个深层概率模型,该模型将视觉信息映射到有效的机器人轨迹的分布中。提出了导致轨迹精度最高水平的结构,并与现有方法进行了比较。此外,本文介绍了一种用于学习域特异性潜在特征的新型培训方法。我们展示了在实验室的草莓收集任务中提出的概率方法和新颖的潜在空间学习的优势。实验结果表明,潜在空间学习可以显着改善模型预测性能。提出的方法允许从分布中采样轨迹并优化机器人轨迹以满足次级目标,例如避免碰撞。
translated by 谷歌翻译